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摘要 : [目的 /意义 ] 弥补 大 数据 治理 体系 构建 方法 论 研究 的 不 足 , 提 出 更 具 通 用 性 的 大 数据 治理 体系 构建 
方法 论 框 架 。[ 方法 “过程 ] 从 方法 论 概 念 入 手 , 对 ISO 国际 标准 化 组 织 关于 方法 论 的 定义 和 现 有 的 方法 论 研 究 
成 果 进 行 系统 梳理 ,识别 出 方法 论 要 素 及 类 别 ,并 构建 方法 论 框 架 ; 基 于 给 定 的 方法 论 框 架 , 从 理论 、 概 念 模 型 、 
原则 和 规则 、 过 程 和 程序 方法 和 评估 标准 等 方法 论 要 素 对 现 有 大 数据 治理 研究 成 果 进 行 映射 分 析 ; 在 综合 集 
成 大 数据 治理 体系 构建 方法 论 要 素 的 基础 上 ,结合 戴 明 环 (PDCA ) 的 理论 基础 对 当前 大 数据 治理 体系 构建 方法 
论 进行 修正 和 补充 。[ 结果 /结论 ] 明晰 了 当前 大 数据 治理 体系 构建 方法 论 的 要 素 及 其 关系 ,并 从 综合 集成 视角 


各 出 大 数据 治理 体系 构建 方法 论 框架 构 起。 

于 = 关键 词 : 大 数据 治理 ”大 数据 治理 体系 方法 论 
分 类 号 : C251 
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方法 论 框 架 方法论 要 素 


SN 大 数据 时 代 , 由 数据 化 (datafication ) 形成 的 “数字 
空间 ” 越 来 越 能 近似 地 反映 人 类 社会 空间 和 物理 空间 ， 
数据 化 已 经 成 为 理解 社会 和 社会 行为 的 一 种 公认 的 新 
范式 ,如 通过 网 络 媒体 技术 对 人 类 各 种 行为 和 社交 活 
动 进行 客观 量化 和 潜在 追踪 ”。 大 数据 发 展 将 对 产业 
升级 .科学 研究 、 人 类 认 知 范式 产生 重要 影响 ”“ ,大 
数 竹 本 身 列 藏 的 价值 使 其 成 为 各 国 角逐 的 焦点 ,尤其 
在 推进 国家 治理 体系 和 治理 能 力 现代 化 进程 中 作用 日 
益 凸 显 。 目 前 ,大 数据 治理 已 经 成 为 各 个 国家 、 地 区 、 
行业 发 展 的 重要 议题 ,并 成 为 跨 学 科学 者 共同 关注 的 
研究 热点 问题 。 

围绕 大 数据 治理 议题 ,当前 已 经 形成 了 诸多 的 大 


所 构成 的 大 数据 治理 框架 ,由 治理 目标 .权力 层次 、 
治理 对 象 .解决 问题 等 核心 概念 构成 的 概念 体系 ”“”， 
经 由 人 , 物 \ 数 据 、 技 术 高 度 融 合 而 构成 的 治理 框架 ; 
加 由 宏观 、 中 观 、 微 观 层 次 ( macro -micro structure - 
based ) 构 成 的 大 数据 治理 体系 建构 框架 "" ;@@ 基 于 过 
程 (process-based) 的 大 数据 治理 体系 框架 ,例如 ,从 数 
据 源 层 .数据 融合 层 .知识 发 现 层 直 至 决策 层 构 成 的 多 
层 架 构 体 系 ' ,贯穿 大 数据 全 生命 周期 ( 创建、 维护 和 
利用 ) 的 治理 模型 ""。 另 有 学 者 从 其 他 角度 对 大 数据 
治理 体系 构建 进行 了 研究 ,如 翟 云 ” 侧重 大 数据 治理 
机 制 框 架 研 究 , 安 小 米 等 "” 从 大 数据 资源 供给 治理 体 
系 、 保 障 治理 体系 以 及 服务 治理 体系 3 个 维度 提出 了 
大 数据 治理 规则 体系 构建 的 研究 构想 ,S. H. Zhang 
等 ' 引 基于 行为 者 网 络 关系 ( Actor Network -based ) 构建 


数据 治理 框架 和 体系 。 基 于 不 同 的 行业 需求 .不 同 的 
学 科 视 角 和 研究 目标 ,大 数据 治理 体系 研究 主要 包括 
以 下 3 个 方面 :基于 要 素 ( component-based ) 的 大 数 
据 治理 体系 框架 ,如 普遍 认可 的 由 大 数据 治理 目标 . 主 
体 客体 和 过 程 (活动 ) 等 构成 的 大 数据 治理 体系 "” ， 
以 信息 治理 .产业 和 功能 场景 及 其 大 数据 类 型 为 要 件 


了 大 数据 治理 网 络 模型 。 在 大 数据 治理 体系 构建 中 ， 
有 部 分 研究 提 到 了 体系 构建 的 方法 论 , 如 明 欣 等 “将 
复杂 系统 论 作为 其 治理 框架 构建 的 方法 论 支 撑 , 杨 琳 
等 中 则 基于 EDM ( Evaluate -Direct-Monitor) 方法 论 构 
建 了 大 数据 环境 下 的 数据 治理 框架 ; 程 永 新 ”从 “应 
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该 做 什么 ,怎么 落地 ,怎样 持续 落地 ”3 个 问题 出 发 构 
建 了 大 数据 时 代 企 业 数 据 资产 管理 方法 论 模型 ,Q.Li 
等 则 采用 了 典型 的 案例 研究 方法 ,包括 文献 综述 .专家 
咨询 .解释 性 结构 建 模 等 方法 构建 了 医疗 大 数据 治理 
框架 "”,S，U，LEE 等 "在 数据 治理 框架 构建 中 , 提 
出 了 包含 3 个 步 又 的 方法 论 路 径 图 。 此 外 , 现 有 研究 
多 以 问题 为 导向 ,或 以 应 用 需求 为 导向 "9 ,从 治理 要 
素 ,治理 过 程 .治理 层次 或 治理 机 制 等 不 同 角度 来 构建 
大 数据 治理 框架 或 体系 , 较 少 明确 提出 治理 框架 或 体 
系 构建 的 方法 论 依 据 。 当 前 ,不 同行 业 领域 和 不 同学 
科 视 角 下 的 大 数据 治理 框架 和 体系 构建 存在 以 下 研究 
局 限 :@ 不 同 视 域 下 提出 的 大 数据 治理 体系 往往 缺少 
统一 的 理论 基础 与 概念 体系 ,同时 , 跨 视 域 的 研究 成 果 
较 少 ,大 数据 治理 体系 的 互联 互通 和 互信 互 认 问题 沿 
未 受到 足够 重视 。 例 如 ,关于 大 数据 治理 的 核心 概念 


如 大 数据 治理 "”"… ,因而 有 待 进一步 强化 覆盖 宏观 、 
中 出 和 微观 多 层次 和 多 维度 的 大 数据 治理 体系 构建 广 
法 论 的 研究 ;@ 虽 然 部 分 文献 提出 了 大 数据 治理 体系 
构建 的 方法 论 , 但 并 未 对 方法 论 概念 进行 明确 界定 , 尚 
情 星 少 跨 视 域 的 大 数据 治理 体系 构建 方法 论 及 其 综合 
集成 应 用 框架 。 在 涉及 多 因素 和 多 要 素 关系 的 研究 
中 2 复杂 系统 论 通常 被 视 作 数据 治理 体系 框架 构建 的 
理 漆 基 础 ,EDM( Evaluate-Direct-Monitor) 模 型 则 从 活动 
角度 提出 了 数据 治理 体系 构建 的 方法 论 , 另 有 研究 从 
具体 方法 .体系 构建 路 径 等 角度 阐释 其 方法 论 依据 。 
然而 ,不 同 研究 对 方法 论 的 认识 不 同 , 且 视 角 较为 音 
一 ,缺乏 从 方法 论 的 多 要 素 构 成 及 要 素 关系 等 综合 集 
成 应 用 角度 来 思考 大 数据 治理 体系 构建 的 方法 论 研 
多 。 

由 此 ,本 文采 用 综合 集成 研究 视角 ,在 明确 界定 方 
法 论 通用 概念 及 其 构成 要 素 的 基础 上 ,探索 不 同 研究 
情境 下 大 数据 治理 体系 构建 的 方法 论 要 素 和 类 型 , 旨 
在 提出 跨 域 融合 更 具 通用 性 和 普 适 性 的 大 数据 治理 体 
系 构建 方法 论 框架 。 论 文 围绕 大 数据 治理 及 体系 构建 
方法 论 回答 了 以 下 3 个 主要 问题 :方法论 概念 及 其 
构成 要 素 是 什么 ?加 当前 大 数据 治理 体系 构建 方法 论 
的 要 素 有 哪些 ?是 什么 ?加 综合 集成 视角 下 的 大 数据 
治理 体系 构建 方法 论 框架 是 什么 ? 各 类 要 素 之 间 的 关 
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联 关系 如 何 ? 
2 方法 论 概念 界定 

关于 方法 论 的 理解 往往 存在 两 种 趋向 :一 种 是 将 
方法 论 视 为 抽象 概念 , 另 一 种 则 将 方法 论 与 方法 混 
同 “。 对 方法 论 的 探讨 ,本 文 基于 ISO 关于 方法 论 的 
术语 定义 ,并 结合 方法 论 研 究 的 相关 文献 ,明确 方法 论 
的 概念 内 涵 。 同 时 ,通过 对 方法 论 定 义 中 的 属 概 念 及 
种 差 进行 分 析 , 明 晰 方法 论 的 关键 构成 要 素 ,建立 方法 
论 构 建 要 素 分 析 框架 。 
2.1 方法 论 定义 及 构成 要 素 

方法 论 常常 易 与 认识 论 或 科学 哲学 混淆 ,从 该 
角度 来 讲 , 方 法 论 是 “关于 认识 世界 .改造 世 界 的 根本 
方法 的 理论 ”3 ,是 一 种 元 理论 ,是 “支撑 任何 自然 , 社 
会 或 人 文科 学 研究 的 基本 原理 和 哲学 假设 ” ,该 视角 下 
的 方法 论 往往 具有 各 种 哲学 立场 ,对 其 所 遵循 的 诸 方 
法 论 原则 给 予 哲 学 的 检视 与 规定 。 毋 庸 置 疑 ,上 述 
所 讲 的 方法 论 是 最 高 层次 的 哲学 方法 论 。 由 于 大 数据 
治理 体系 是 一 个 “社会 建构 + 技术 建构 ”的 综合 体系 ， 
包含 跨 学 科 和 跨 领域 的 内 容 , 涉 及 复杂 的 应 用 场景 , 因 
此 ,本 文 则 在 明晰 决定 和 影响 这 些 跨 学 科 和 跨 领 域 大 
数据 治理 体系 构建 过 程 通用 方法 论 体系 ,关注 的 是 在 
一 定 哲学 思想 指导 下 适用 于 多 学 科 和 多 领域 的 一 般 科 
学 方法 论 , 是 在 具体 方法 论 研 究 和 应 用 中 揭示 出 的 具 
有 普遍 意义 的 方法 论 。 

根据 ISO 国际 标准 化 组 织 术 语 库 、 术 语 标 准 和 术 
语 条 款 中 关于 “方法 论 ” 的 定义 ,并 结合 方法 论 相 关 研 
究 发 现 , 不 同学 科 领 域 关 于 方法 论 的 定义 和 描述 都 存 
在 共通 点 , 即 方法 论 往往 与 研究 范式 和 理论 框架 相 
关 “-”1, 具 有 特定 的 认识 论 问题 和 人 逻辑 问题 。 同 时 ， 
方法 论 不 是 具体 的 方法 本 身 , 而 是 对 方法 的 描述 、 解 释 
和 证 明 2 , 它 规定 应 该 做 什么 ,不 应 该 做 什么 , 先 做 
什么 ,后 做 什么 ,怎样 做 才能 取得 最 优 的 结果 ,是 做 事 
的 依据 ,为 如 何 做 事 提 供 原 则 和 规则 ,而 方法 往往 只 是 
提供 用 什么 做 的 问题 ,为 如 何 做 事 提 供 路 径 , 它 与 具体 
的 实现 工具 、 技 术 、 方 式 等 密切 关联 ”"。 看 似 对 方法 
论 的 理解 比较 抽象 ,实质 上 ,方法 论 可 以 通过 一 系列 元 
素 实 现实 例 化 和 具体 化 ,可 以 基于 特定 的 (研究 ) 步 
又 和 元 素 被 明确 定义 2 。 根 据 多 科学 领域 关于 方法 
论 的 概念 界定 ( 见 表 1) 得 知 ,方法 论 是 由 若干 要 素 组 
成 的 方法 论 体系 ,该 体系 中 的 要 素 包 括 理论 和 价值 观 、 
概念 模型 .基本 原则 、 规 则 、 程 序 、. 过程、 指令 、 实 现 方 
法 .评估 标准 等 等 。 
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表 1 方法 论 定 义 及 要 素 


序号 方法 论 定 义 要 素 

D1 应 用 于 IT 安全 评估 的 原则 ,程序 和 过 程 的 体系 [3] 原则 程序 和 过 程 

D2 一 组 逐步 帮助 用 户 的 指令 (通过 文本 、 计 算 机 程序 工具 提供 ) [301 指令 

D3 定义 产品 或 系统 开发 完整 方式 的 标准 ,程序 和 支持 方法 的 集合 B31] 标准 ,程序 和 支持 方法 

D4 为 达到 目的 而 使 用 的 一 套 特定 的 方法 或 程序 [321 方法 ,程序 

D5 可 以 为 特定 应 用 选择 相关 子 集 的 一 组 连贯 的 集成 的 方法 。 一 种 方法 论 至 少 应 该 包括 4 个 部 分 : 概念 模型 .程序 (方向 和 顺序 ) 、 
1. 一 个 对 特定 问题 至 关 重 要 的 概念 模型 指南 .评价 准则 
2. 指示 前 进 方向 和 顺序 的 一 套 程序 


3. 辨识 应 该 避免 的 事项 的 一 系列 指南 
4. 一 组 评估 产品 质量 的 评价 准则 .33] 


了 IC 


D6 个 应 用 于 特定 知识 分 支 的 原则 实践 和 程序 的 体系 。 对 设计 科学 的 研究 ,方法论 包括 3 个 要 素 :定义 设计 科 
学 研究 的 概念 原则 实践 规则 以 及 开展 和 展示 研究 的 过 程 [341 
D7 “进行 一 项 特定 研究 的 方法 或 规则 的 集合 "以 及 “支持 特定 研究 方法 的 原则 ,理论 和 价值 观 ” [551 


D8 方法 论 可 被 视 为 行动 阅读 , 即 为 了 达到 一 个 特定 的 目标 或 目的 ,在 特定 的 态度 ,环境 和 概念 下 必须 做 什么 。 方 法 论 


概念 原则 .实践 规则 过程 


方法 规则、 原则 理论 和 价值 观 
原则 .指令 .路 径 ( 过 程 和 程序 ) 


指示 到 达 目 标的 主要 路 径 , 但 不 指定 各 个 步骤 。 它 的 功能 就 像 


2.2> 方法 论 要 素 分 析 框架 构建 

综合 分 析 JS0 国际 标准 化 组 织 对 “方法 论 ” 的 定义 
方法 论 至 少 要 具备 以 下 6 个 方面 的 构成 要 素 :四 
基础 :为 实现 特定 目标 或 满足 实践 场景 需求 所 采用 


的 杠 关 理论 ,作为 指导 各 种 方法 .技术 和 工具 等 应 用 的 
理论 依据 ;@) 概 念 模型 :揭示 特定 问题 的 分 析 框架 和 研 
经 = 


辑 ;(3) 基 本 原则 和 规则 :达到 特定 目标 或 满足 实践 


AN 


场 这 需求 应 该 遵循 的 基本 原则 和 规则 ,以 明确 在 特定 情 
境 同 点 该 做 什么 和 不 应 该 做 什么 ,保证 行动 的 合理 性 和 


过 种 和 程序 :该 过 程 和 程序 包含 前 进 方向 和 先后 顺序 
等 6@) 方 法 :作为 构成 方法 论 的 核心 内 容 ” ,包括 过 程 和 
程 掌 中 应 用 的 具体 方法 ;@ 依 托 预 设 的 目标 和 实践 场景 
需 小 所 采用 的 一 套 评估 标准 。 基 于 方法 论 构成 要 素 及 
关联 关系 提出 方法 论 要 素 分 析 框 架 ,如 图 1 所 示 : 


理论 基础 
基本 原则 和 规则 
先天 1 一 基 一 2 一 姑 盖 C—O ol 
站 中 
概念 模型 A 4 ‘ 目标 实现 
| | | | je 
i 方法 | 

. J 

评估 标准 


1 方法 论 要 素 分 析 框 架 


3 ”大 数据 治理 体系 构建 方法 论 构 成 要 素 


映射 与 解构 


3.1 文献 调查 与 编码 分 析 
本 文 围绕 “大 数据 治理 ”进行 中 英文 文献 检索 。 


个 指南 针 ， 


个 灯塔 ,一 套 原 则 和 全 球 指令 [26] 


中 文 文献 检索 以 CNKI 为 来 源 数据 库 , 以 “题名 = 大 数 
据 AND 题名 = 治理 ”和 “题名 = 大 数据 治理 ”为 检索 
式 进行 核心 期 刊 论文 检索 ,文献 发 表 时 间 不 限 ,截至 
2019 年 1 月 13 日 共 检索 到 285 篇 。 英 文 文献 检索 数 
据 库 包括 WOS 核心 合集 JSTOR .Springer .Emerald , 检 
索 式 为 “TI = (big data govern * ) OR TI = (big data 
AND govern * )” ,文献 发 表 时 间 不 限 ,截至 2019 年 1 
月 13 日 去 重 后 共 检 索 到 123 篇 。 根 据 本 文 研究 问题 
和 研究 需要 ,确定 代表 性 文献 选择 标准 ,内 容 如 下 :中 ) 
针对 大 数据 治理 体系 构建 方法 论 的 专门 研究 ;@ 明 确 
提出 大 数据 治理 体系 构建 的 方法 论 ;未 明确 方法 论 
应 用 ,但 是 大 数据 治理 体系 构建 体现 了 方法 论 的 相关 
要 素 。 基 于 上 述 盘 选 标准 ,并 根据 课题 组 系列 大 数据 
治理 专题 研究 ,补充 了 相关 文献 , 共 获 得 28 篇 中 英文 
代表 性 文献 。 考 虑 到 “大 数据 治理 ”部 分 研究 属于 “ 数 
据 治理 "范畴 ,本 文 遵循 第 一 次 文献 检索 条 件 ,以 “篇 
名 = 数据 治理 “TI = data govern * "分别 进行 中 英文 
文献 补充 检索 。 最 终 ,本 文选 取 了 36 篇 代表 性 文献 ， 
其 中 ,中 文 文献 24 篇 ,英文 文献 12 篇 。 

对 筛选 提出 的 中 英文 文献 进行 文献 编码 分 析 , 主 
要 依据 所 提出 的 方法 论 要 素 分 析 框 架 , 目 的 是 “采用 正 
式 、 系 统 的 方法 从 主要 研究 中 提取 相关 信息 ”” ,编码 
表 的 字段 名 包括 编号 .大 数据 治理 体系 构成 方法 论 视 
角 方法 论 要 素 方法论 要 素 具 体 描述 及 其 文献 来 源 等 
5 项 内 容 , 分 析 单元 的 具体 说 明 如 表 2 所 示 。 需 要 指 
出 的 是 ,本 文 从 体系 构成 的 方法 论 视角 对 所 选 代 表 性 
文献 进行 了 补充 分 析 , 旨 在 了 解 不 同 视 域 下 大 数据 治 
理 体系 构建 方法 论 的 异同 点 ,并 重点 梳理 和 把 握 共 
通 点 。 


下 
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表 2 大 数据 治理 体系 相关 文献 编码 分 析 单 元 


字段 名 具体 说 明 
编号 36 篇 代表 性 文献 的 唯一 代码 [1 -36]】 
大 数据 治理 体系 构成 大 数据 治理 体系 的 主要 构成 要 素 
方法 论 视角 生命 周期 或 与 业务 过 程 集成 导向 流程 导向 ,治理 要 素 控制 导向 ;治理 层次 控制 导向 ;其 他 
方法 论 要 素 大 数据 治理 体系 构建 方法 论 的 要 素 , 主 要 包括 理论 .概念 模型 .基本 原则 和 规则 .程序 和 过 程 .方法 .评估 标准 等 
具体 描述 关于 大 数据 治理 体系 构建 的 理论 .概念 模型 .基本 原则 和 规则 .程序 和 过 程 .方法 ,评估 标准 等 特征 和 条 件 的 具体 内 容 描述 


注 :对 所 选 代表 性 文献 采用 单独 编码 体系 【1 - 36 】 ,与 参考 文献 编码 顺序 并 无 关联 性 


3.2 ”大 数据 治理 体系 构建 方法 论 要 素 及 其 解构 


采用 综合 集成 视角 ,对 中 英文 文献 中 涉及 的 方法 论 


据 治 理 体 系 构建 的 理论 基础 ,概念 模型 .过 程 和 程序 、 具 
体 实现 方法 等 方面 , 鲜 有 提 及 体系 构建 的 原则 和 规则 ， 


要 素 进行 辨析 与 解构 。 研 究 表明 ,当前 研究 集中 在 大 数 。 更 缺少 对 大 数据 治理 体系 的 评估 标准 ,如 表 3 所 示 : 
表 3 大 数据 治理 体系 构建 方法 论 相 关 文献 的 要 素 解构 


方法 论 要 素 


要 素 内 容 


丰 训 法 论 视角 1 ) 治 理 要 素 控制 原理 [4-9,15-17,19 -20,36-44]， 
2 ) 治理 过 程控 制 原理 [1 2, -4]; 


加 


4) 与 特定 场景 治理 理念 和 业务 目标 保持 一 致 [20,5] 


从 
注 
溢 


2) 目标 .权利 层次 ,对象 及 范围 .解决 的 实际 问题 [7 -8]; 


4) 数 据 \ 信 息 , 平 台 (参与 ) .协作 、 安 全 五 要 素 [45]; 


chinaXiv 


过 程 和 程序 


节 [5,7,9-10,16,19,36-37,39 -40,42 -43,45 -48]， 
; 


1) 治理 理念 .治理 主体 治理 客体 治理 工具 治理 目标 [9]; 


5) 数 据 观 (数据 处 理 ,数据 共享 .数据 开放 ) 技术 观 (技术 架构 .基础 设施 、 
6) 核 心 要 素 ( 数 据 \ 决 策 者 .决策 域 ) .支持 要 素 的 适当 流程 1201 

界定 大 数据 治理 概念 内 涵 ; 分 析 大 数据 治理 动议 ;基于 特定 理论 和 视角 对 大 数据 治理 核心 要 素 进行 识别 ,并 辨析 要 素 关系 ;构建 大 数据 治 
理 体系 框架 并 与 特定 目标 相 匹 配 ;提出 大 数据 治理 实施 路 径 。 


治理 主体 的 公共 治理 理论 ( 整体 性 治理 .精准 化 治理 和 参与 式 治理 ) [0] 协同 理论 (协同 创新 协同 治理 ) 4.16,51 -2] 行为 


体系 实施 流程 的 理论 :基于 EDM( Evaluate-Direct-Monitor) 的 治理 方法 论 L71 Petri 网 [5] 基于 属性 图 的 流程 模型 [4] 


> 
TT 3 ) 治理 层次 控制 原理 ,S93]， 
Oy) 4) 治理 机 制 控制 原理 3] 
CN a 1 面向 大 数据 治 
©O 者 网 络 理论 115]， 
OO 2) 面向 大 数据 治理 客体 的 数字 治理 理论 [3 -54]; 
| 3 ) 面向 大 数据 治理 活动 的 信息 生命 周期 理论 12 6] ,数字 连续 性 理论 16]; 
© 4) 面向 大 数据 治理 目标 的 公共 价值 理论 04]; 
CD 5) 面向 
on 和 规则 ”1) 以 人 为 中 心 的 体系 设计 原则 ,强调 满足 多 元 主体 的 价值 追求 和 利益 诉求 9,11,20]，; 
Ql 2) 从 安全 和 数据 主权 的 高 度 出 发 ,纳入 全 局 数据 治理 框架 中 [4 .5 ; 

3 ) 强调 基于 数据 资源 .尊重 数据 规律 使用 数据 方法 和 遵循 数据 伦理 等 循 数 治 理 理念 [720,53]，; 


3) 宏 观 (概念 体系 、 体 系 框架 ) .中 观 (管理 机 制 . 计 划 ,部署 ) .微观 (程序 .工具 ) 10,*]，; 


服务 ) ,资源 观 (资源 开发 ,资源 安全 )136]; 


阳 


部 分 文献 增加 了 案例 分 析 、 技 术 方 案 、 体 系 实施 流程 图 或 成 熟 度 测评 等 环 


关联 概念 辨析 ( 大 数据 治理 ,数据 治理 信息 治理 等 ) ;界定 大 数据 治理 概念 内 涵 ; 分 析 大 数据 治理 动议 ;在 现 有 数据 治理 或 信息 治理 模型 


2) 多 种 方法 组 


尽管 当前 并 不 存在 一 个 统一 适用 的 大 数据 治理 体 
系 ,但 是 体系 构建 的 视角 却 存 在 一 定 相 似 规律 。 如 表 
3 所 示 ,基于 治理 要 素 控 制 的 方法 论 视角 构建 大 数据 
治理 体系 是 当前 的 主流 。 除 治理 要 素 控制 视角 ,基于 
治理 过 程控 制 的 体系 构建 (如 针对 生命 周期 或 与 业务 
过 程 集 成 、 治 理 流程 的 控制 ) 也 是 一 个 趋势 。 在 理论 基 
础 方面 ,当前 研究 多 聚焦 于 治理 主体 、 客 体 、 活 动 和 目 
标 等 关 平 体系 构成 内 容 的 多 元 理论 选择 ,有 部 分 文献 
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基础 上 建构 大 数据 治理 体系 ,并 与 特定 目标 相 匹配 ;部 分 文献 增加 了 案例 分 析 体系 实 施 流程 图 等 环节 [145,17,20,33,49] 
方法 下 ) 仅 以 文献 看 究 为 主 5 i 方 法 [7 -9,12,15 -17,37 -40,42 -43,45,48 -49] ; 

合 使 用 ,尤其 强调 三 角 互 证 法 的 应 用 :文献 调研 + 访谈 + 政策 工具 文献 研究 + 案例 分 析 + 政策 工具 + 访谈 文献 研究 + 案 
例 分 析 文献 研究 + 政策 工具 文献 调研 + 概念 解析 等 中 -0 92304469] 


基于 EDM(Evaluate -Direct -Monitor ) 、Petri 网 等 建构 了 
大 数据 治理 体系 及 其 实施 流程 图 。 概 念 模型 揭示 出 大 
数据 治理 体系 构成 的 核心 概念 .关键 性 问题 和 构成 对 
象 ,涉及 的 概念 维度 主要 有 4 类 :中 治理 理念 .治理 主 
体 治理 客体 ,治理 工具 治理 目标 五 要 素 集 成 论 ;@) 安 
观 . 中 观 、 微 观 三 层次 要 素 集成 论 ;@ 数 据 观 .技术 观 、 
资源 观 三 要 素 集 成 观 ; 由 数据 信息 .平台 (参与 ) 、 协 
作 ` 安 全 五 要 素 集成 观 。 大 数据 治理 体系 构建 原则 主 


"|_* NA。 八 、/ /一 廿 口 
广 mn 一 人 (和 下 器 日 
LnlInaxIV 瑟 1 其 


干 || 
[ 


安 小 米 , 王丽丽 .大 数据 治理 体系 构建 方法 论 框架 研究 [J]. 图 书 情报 工作 ,2019 ,63(24) :43 -51. 


要 包括 以 人 为 中 心 的 设计 原则 ,突出 数据 主权 和 数据 
安全 ,遵循 循 数据 治理 理念 ,并 强调 与 特定 场景 治理 理 
念 和 业务 目标 保持 一 致 。 关 于 大 数据 治理 体系 构建 的 
过 程 和 程序 ,不 同 研究 在 具体 实施 环节 先后 顺序 等 方 
面 存在 差别 ,但 是 ,体系 构建 的 主要 逻辑 和 实现 路 径 可 
归纳 为 3 类 :GD 遵循 概念 界定 、 动 议 分 析 、 核 心 要 素 识 
别 并 辨析 要 素 关 系 ,构建 体系 框架 并 与 特定 目标 匹配 ， 
提出 实施 路 径 的 研究 逻辑 ;@@ 按 照 关联 概念 辨析 ( 大 数 
据 治理 ,数据 治理 、 信 息 治理 等 ) .大 数据 治理 概念 界 
定 动议 分 析 , 在 现 有 数据 治理 或 信息 治理 模型 基础 上 
建构 体系 并 与 特定 目标 相 匹配 ,提出 实施 路 径 的 研究 
过 程 ;@ 在 体系 构建 后 ,借助 案例 分 析 进 一 步 验 证 治理 
体系 的 的 合理 性 和 适用 性 , 另 有 研究 提出 了 相应 的 技 
术 才 案 .体系 实施 流程 .成 熟 度 测评 等 。 在 研究 方法 方 
面 也 定性 方法 为 主 ,基于 归纳 和 演绎 逻辑 建构 体系 ， 
振 吕 采用 的 具体 方法 包括 文献 调研 .政策 工具 ,案例 分 
村 沪 谈 ,比较 研究 概念 解析 ( 解构、 建构. 重 构 ) 等 ， 
辕 关 多 局 限于 文献 研究 , 尚 缺 少 多 种 方法 组 合 的 实证 
研究 。 

4 ”大 数据 治理 体系 构建 方法 论 集成 框架 
及 其 要 素 关系 

4.N 大 数据 治理 体系 构建 方法 论 综合 集成 框架 的 提 


2 汉 大 数据 治理 体系 构建 的 各 种 方法 论 既 有 共通 之 
处 6 叉 有 不 同 的 关注 焦点 。 各 种 方法 论 优势 互补 ,综合 
集成 应 用 对 于 建构 科学 合理 的 大 数据 治理 体系 具有 
E 雪 意义 。 但 是 ,上 述 分析 表 明 , 现 有 大 数据 治理 体系 
身 建 方法 论 缺 乏 相 应 的 评估 环节 ,同时 文献 研究 的 成 
果 在 具体 的 方法 应 用 方面 对 实践 应 用 路 径 关注 不 足 。 
PDCA(Plan -Do-Check -Action ) 作为 全 面 质量 管理 的 方 
法 依据 ,其 基本 原理 是 迭代 循环 , 即 通过 不 断 循环 执行 
直至 问题 解决 。 而 大 数据 治理 体系 作为 一 个 具有 社会 
建构 和 技术 建构 双重 建构 属性 的 复杂 体系 ,借鉴 PD- 
CA 的 过 程 方法 和 和 迭代 思路 对 其 进行 持续 性 改进 具有 
重要 意义 。 因 此 ,本 文 在 综合 集成 应 用 前 期 研究 成 果 
基础 上 ,结合 PDCA 的 过 程 方法 对 当前 大 数据 治理 体 
系 构建 方法 论 要 素 进行 了 综合 集成 ( 见 图 2) 。 

图 2 提出 了 大 数据 治理 体系 构建 方法 论 的 综合 
成 框架 :在 规划 和 计划 阶段 ,以 掌握 特定 场景 中 的 大 数 
据 治理 状态 ,确定 其 需求 和 目标 ,定义 大 数据 治理 概念 
模型 为 关键 环节 ;实施 阶段 则 通过 建立 多 元 理论 基础 ， 
确定 体系 构建 的 视角 以 及 借鉴 行业 和 学 术 成 果 中 的 数 


上 


-过 


可 


据 治 理 框架 ,构建 大 数据 治理 体系 框架 ,并 提出 具体 的 
实施 路 径 和 流程 ;检查 阶段 以 评估 体系 的 理论 支持 、 目 
标 符合 性 以 及 与 设计 原则 的 匹配 性 为 中 心 ; 在 处 理 阶 
段 ,基于 体系 评估 结果 ,在 多 元 理论 指导 下 ,提出 体系 
改进 和 优化 的 方案 ,并 对 其 有 效 性 进行 验证 。 

4.2 ”大 数据 治理 体系 构建 方法 论 集 成 框架 的 要 素 关 
系 阐释 

4.2.1 计划 阶段 :解决 治理 体系 的 适应 性 问题 “在 规 
划 和 计划 阶段 ,明晰 场景 。 针 对 特定 场景 的 特定 问题 
和 动议 ,定义 大 数据 治理 的 需求 和 目标 。 同 时 ,该 阶段 
应 该 优先 界定 大 数据 治理 概念 模型 , 当前 的 研究 主流 
是 从 治理 主体 客体 活动 工具、 目标 5 个 维度 去 建构 
大 数据 治理 的 概念 模型 。 大 数据 治理 需要 吸收 多 学 科 
和 多 领域 的 治理 主体 ,构建 由 政府 、 企 业 、 社 会 组 织 
公众 等 多 元 主体 构成 的 联盟 ;治理 客体 贯穿 跨 层 级 . 跨 
地 域 . 跨 领 域 . 跨 系统 . 跨 部 门 和 跨 业 务 的 多 样 化 数据 ， 
对 象 宜 覆 盖 多 源 数据 及 其 融合 ;治理 活动 具有 歼 盖 数 
据 全 生命 周期 .数据 处 理 和 管理 关键 业务 环节 的 特点 ， 
体现 的 是 多 层次 活动 的 互通 ;治理 工具 包括 社会 性 工 
具 ( 契 约 化 工具 、 网 络 化 工具 政策 工具 等 ”“; ) 和 技术 
性 工具 (信息 基础 设施 .大 数据 技术 ,监测 工具 等 5 ) ， 
体现 的 是 多 样 化 工具 的 联结 ;治理 目标 主要 聚焦 治理 
能 力 提 升 . 运 营 合 规 .风险 管控 和 价值 创造 等 方面 , 体 
现 的 是 多 元 价值 诉求 的 兼容 。 

4.2.2 实施 阶段 :解决 治理 体系 构建 的 复杂 性 问题 
作为 兼 具 社 会 建构 和 技术 建构 双重 建构 属性 的 复杂 体 
系 ,大 数据 治理 体系 需要 多 元 理论 的 支持 ,如 面向 大 数 
据 治理 主体 的 公共 治理 理论 (整体 性 治理 、 精 准 化 治理 
和 参与 式 治理 等 ” ) .协同 创新 理论 (尤其 是 协同 创新 
共同 体能 力 构 建 ”“ ) 等 ,面向 大 数据 治理 客体 的 数 
字 治 理 理论 ;面向 大 数据 治理 活动 的 信息 生命 周 
期 理论 和 数字 连续 性 理论 "" ,面向 大 数据 治理 目标 的 
公共 价值 理论 ""” 。 在 方法 论 视角 方面 ,治理 要 素 控 
制 ,治理 过 程控 制 治理 层次 控制 和 治理 机 制 控制 是 当 
前 主要 的 方法 论 视角 。 治 理 要 素 控 制 是 方法 论 视 角 中 
研究 最 多 的 ,尽管 各 项 研究 在 要 素 选 取 方 面 存在 差异 ， 
但 一 般 都 遵循 治理 主体 客体 活动 .工具 和 目标 等 要 
素 选 取 思 路 。 在 治理 过 程控 制 方面 ,体系 需要 体现 出 
全 生命 期 .全 流程 ,全 要 素 的 综合 集成 管理 。 在 治理 层 
次 控制 方面 ,大 数据 治理 体系 可 从 宏观 、 中 观 、 微 观 3 
个 层面 进行 构建 。 在 基于 治理 机 制 控制 的 方法 论 视 角 
中 ,运行 机 制 .协同 创新 机 制 .动力 机 制 和 保障 机 制 等 
多 维 机 制 是 建构 大 数据 治理 体系 可 参照 的 机 制 视角 。 
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人 图 2 基于 PDCA 的 大 数据 治理 体系 构建 方法 论 综合 集成 框架 
例如 ,性 云 ' ”从 信息 扩张 、 市 场 拉动 ,政府 公信 绩效 ”在 数据 资产 概念 基础 上 的 数据 权 是 治理 体系 需要 考虑 


评价 和 法 律 保障 制 5 个 机 制 维度 提出 了 大 数据 治理 的 
框架 结构 , 郑 大 庆 等 ”“ 则 从 决策 机 制 .监督 机 制 和 激励 
与 约束 机 制 确 定 了 大 数据 治理 的 关键 要 素 。 

4.2.3 体系 评估 和 改进 阶段 :解决 治理 体系 的 长 效 性 
问题 ”体系 评估 和 体系 改进 阶段 是 当前 大 数据 治理 体 
系 构 建 方法 论 研 究 需要 不 断 强化 的 两 个 关键 环节 。 在 
体系 评估 阶段 ,可 采用 专家 评估 法 和 案例 验证 法 对 大 
数据 治理 体系 进行 评 佑 ,至少 需 要 检验 体系 构建 是 否 
合乎 现 有 的 理论 ,同时 需要 对 体系 目标 符合 性 体系 与 
设计 原则 的 匹配 性 进行 评 佑 。 其 中 ,以 人 为 中 心 的 设 
计 原 则 注重 多 元 主体 平等 参与 大 数据 治理 体系 构建 的 
话语 权 ,强调 满足 多 元 主体 的 多 元 价值 诉求 和 实现 方 
式 ;数据 安全 和 数据 权 属 原则 意味 着 数据 安全 和 建立 
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的 关键 治理 域 ; 循 数 治理 理念 体现 为 基于 数据 资源 . 尊 
重 数据 规律 ,使 用 数据 方法 和 遵循 数据 伦理 的 原 
则 中 ;场景 化 则 强调 与 特定 场景 中 的 治理 理念 和 业务 
目标 保持 一 致 性 。 在 体系 改进 阶段 ,需要 基于 评估 结 
果 对 体系 进行 改进 和 优化 ,并 对 优化 方案 进行 有 效 性 


检验 。 
SS 人 


本 文系 统 回答 了 “方法 论 及 方法 论 构成 要 素 是 什 
么 “ 现 有 大 数据 治理 体系 构建 方法 论 的 构成 要 素 是 
什么 ”以 及 “大 数据 治理 体系 构建 方法 论 应 该 怎么 样 ” 
三 大 问题 。 针 对 第 一 个 问题 ,本 文 提出 由 理论 .概念 模 
型 .基本 原则 和 规则 .过程 和 程序 方法 .评估 标准 等 多 
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安 小 米 , 王丽丽 .大 数据 治理 体系 构建 方法 论 框架 研究 [J]. 图 书 情报 工作 ,2019,63(24):43 -51. 


要 素 构成 的 方法 论 体系 ,并 据 此 建立 了 由 多 要 素 及 要 
素 关 系 构成 的 方法 论 理论 分 析 框架 。 关 于 第 二 个 问 
题 ,论文 发 现 , 基 于 治理 要 素 控 制 治理 过 程控 制 治理 
层次 控制 和 治理 机 制 控制 是 大 数据 治理 体系 构建 的 主 
要 方法 论 视角 , 尚 缺 少 覆 盖 多 视 域 和 多 层次 的 综合 
成 研究 。 从 大 数据 治理 体系 构建 方法 论 的 构成 要 素来 
看 , 现 有 文献 多 局 限于 理论 基础 、 概 念 模型 .过 程 和 程 
序 .具体 方法 等 单一 要 素 和 单一 层面 ,关于 大 数据 治理 
体系 构建 的 原则 和 规则 及 其 体系 评估 和 体系 持续 性 改 
进 的 研究 尚 显 不 足 。 通 过 对 前 两 个 问题 的 研究 ,论文 
采用 PDCA 的 过 程 方 法 对 现 有 大 数据 治理 体系 构建 方 
法 论 进行 了 修正 和 补充 ,提出 了 大 数据 治理 体系 构建 
方法 论 的 综合 集成 框架 构想 ,综合 集成 了 现 有 大 数据 
治理 体系 构建 的 理论 基础 .概念 模型 .基本 原则 和 规 
则 过程 和 程序 及 其 方法 ,梳理 了 多 要 素 及 其 要 素 关 
二 首 补 充 了 体系 构建 的 评估 和 持续 性 改进 环节 。 
加 基于 PDCA 过 程 方法 批判 分 析 现 有 大 数据 治理 体 
医 网 建 方法 论 构成 要 素 及 关系 ,对 于 融通 现 有 方法 论 
要 素 , 发现 过 程 要 素 中 的 不 足 , 建 立 要 素 间 的 关联 
种 全 补 关系 ,不 断 地 优化 和 改进 大 数据 治理 体系 ,促进 
万 铬 据 治理 体系 实现 其 既定 目标 ,适应 动态 场景 变化 ， 
上 其 洽 理论 意义 和 实践 价值 。 为 治理 体系 构建 的 适应 性 
问题 ,复杂 性 问题 和 长 效 性 问题 解决 提供 了 新 的 思路 。 
< 未 来 研究 团队 将 选择 不 同 场景 开展 多 案例 实证 研 
守 续 发 展 大 数据 治理 体系 构建 方法 论 综合 集成 
架 3 为 治理 体系 构建 的 适应 性 问题 ,复杂 性 问题 和 长 效 
性 问题 解决 提供 最 佳 实践 基准 。 
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Research on Methodology Framework for Big Data Governance System Building 
An Xiaomi”™” Wang Lili' 
! School of Information Resource Management, Renmin University of China ,Beijing 100872 
“Key Laboratory of Data Engineering and Knowledge Engineering ( Renmin University of China) ,Beijing 100872 
“了 -government Research Center (Renmin University of China) ,Beijing 100872 
Abstract: [Purpose/significance | This paper aims to fill in the gaps in research that not enough attention is paid to 
the methodology for big data governance system building, and puts forward more generic methodology framework for con- 
struction of big data governance system. [Method/process | By defining concepts of methodology and the methodology 
framework, this paper systematically analyzes definitions of ISO and the relevant studies, identifies key components of 
methodology and the types of components and then proposes a methodology framework for construction of big data govern- 
ance system. Based on given methodology framework, this paper analyzes the existing studies of big data governance sys- 
tem from 6 methodological components, including theory, conceptual model, principles and rules, processes and proce- 
di ，approaches and methods and the evaluation criteria. Based on the integration of key components of methodologies of 
big data governance system building, this paper recommends a Deming Cycle (PDCA) based approach for an integrated 
fr work for big data governance system building. [ Result/ conclusion | The paper clarifies key issues of research about 
the existing methodology for big data governance system building ,and provides a methodology framework for big data gov- 
e 项 弹 ce system building from a meta-synthetic research perspective. 
Keywords: big data governance big data governance system methodology methodology framework methodology 
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为 了 进一步 推进 学 术 道 德 建设 ,抵制 学 术 不 端 ,建立 公司 
辑 部 针对 学 术 不 端 屡 禁 不 止 等 问题 ,将 进一步 加 强 对 学 术 不 端的 惩戒 力度 ,对 一 稿 两 投 ( 多 投 ) 者 (尤其 是 第 一 作者 
和 通讯 作者 ) 列 人 黑 名 单 ,5 年 内 不 接受 其 投稿 ; 若 已 刊 发 论文 存在 一 稿 两 发 (多 发 ) . 抄 认 、 测 镭 、 造 假 等 各 种 学 术 
不 端 ,将 采取 撤 稿 \ 在 期 刊 及 网 络 平台 公布 , 列 人 黑 名 单 终身 不 接受 其 投稿 等 多 种 处 理 措施 《图 书 情报 工作 》 愿 
与 学 术 界 、 期 刊 界 同仁 一 起 坚决 抵制 学 术 不 端 ,推动 图 书馆 学 情报 学 及 相关 学 科 的 研究 健康 发 展 。 
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